Model Selection

ELECTRA-style Pretraining

# ELECTRA-style Pretraining

Intermediate Base

A Transformer model pre-trained on English corpus using ELECTRA-like self-supervised approach, suitable for sentence summarization tasks.

Large Language Model

Transformers English

funnel-transformer

Deberta V3 Small

DeBERTa-v3 is an improved natural language understanding model developed by Microsoft, optimized through ELECTRA-style pretraining and gradient-disentangled embedding sharing technology to achieve efficient performance while maintaining a relatively small parameter count.

Large Language Model

Transformers English

Deberta V3 Xsmall

DeBERTaV3 is an improved version of the DeBERTa model proposed by Microsoft, which enhances efficiency through ELECTRA-style gradient-disentangled embedding sharing pretraining method, demonstrating excellent performance in natural language understanding tasks.

Large Language Model

Transformers English

Deberta V3 Base

DeBERTaV3 is an improved pre-trained language model based on DeBERTa, which enhances efficiency through gradient-disentangled embedding sharing in ELECTRA-style pretraining and excels in natural language understanding tasks.

Large Language Model English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase